4ye含泪用python爬取了自己的公众号粉丝数据

Original Java4ye Java4ye 2022-09-04

收录于合集 #python 8个

4ye含泪用python爬取了自己的公众号粉丝数据

小伙伴们好呀，最近本来是在捣鼓Gateway的知识点的，结果被一件事情搞得心不在焉哈哈哈哈，结果不得不先鸽下~ 搞完这件事情再继续哦！！ε=ε=ε=(~￣▽￣)~

本来这篇文章得昨天发的，可是出了大大的意外~ （表情👉：） (　o=^•ェ•)o　┏━┓

我以后尽量多准备些备用文章哈哈哈哈，免得经常断档~ (～o￣3￣)～

img

起因

我先简单描述下事情滴经过~

由于最近过年过节发滴红包频繁些~ 导致有好多好友来加我，本想搞个粉丝群活跃下气氛，结果发现来滴怕不是机器人咯，这抢红包滴速度飞快呀，而且 4ye 做事太草率了没有先验证对方是不是真的粉丝想进群的都给拉进去了事后才觉得哪里不对劲！过分！ ( ﹁﹁ ) ~→

img

坑🕳

想着既然已经进群了，那我就自己一个个排查下好了（虽然也就那么12345678个人 ... ） (ˉ▽ˉ；)...

那一刻我还傻傻地以为微信可以轻松地导出群成员~

尝试到最后发现web端早不能用了 😵

但是 4ye我头铁，不肯放弃，愣是想从技术角度上去摸索下，结果搞了老半天都没有搞定我晕

ps：不过现在我有新的想法想尝试下了嘿嘿卖个关子先~

正题

简单介绍下公众号的特征~

公众号有个人的，有政府组织的，还有企业的~

4ye的公众号是个人的~ 😝

这也是为啥有小伙伴在公众号后台留言我看到直接回复他哈哈哈哈

当然小伙伴还是加我微信才能好好沟通~

image-20210220082609054

没有接口权限

个人的公众号是没有办法通过微信认证的，所以下面很多接口都没有权限的（不然我也不用自己去爬了 😵）

image-20210220083636474

结果数据

最后的效果如图~

将拿到的用户名称和头像存取到文本中，

为啥存起来呢~ 当然是当个小数据，为了后面找出群里的假粉做准备~😝

后面有空也可以做下词云看看 😁（给你们一些小惊喜~ 😋）

image-20210220081446738

爬取思路

当然得先在后台分析研究下用户列表，将想要的页面数据和获取下一页发出的 API 进行分析，有兴致的小伙伴们可以先自己研究下哦 ~

这里就简单说下用到的包（注意这里使用到 HTTP2.0 了哦~）

import requests
from bs4 import BeautifulSoup
from hyper.contrib import HTTP20Adapter

还有爬取的数据出现中文乱码的话记得设置 res.encoding = 'UTF-8'

window下写文件时可能也要设置 utf8 哦 fo = open("fans.txt", "a+", encoding='utf-8')

最后

我也收拾收拾准备回广州啦~ seeyou😝

img

谢谢可爱又帅气的大佬们的观看！祝您天天开心！😄

感谢您的关注！您的每个关注，都是博主生发的动力 😝

点个“在看”表示朕

已阅

合成大西瓜之抱歉~ 我只有大西瓜和刀剑神域~!!

了解这些，对在学或者想学编程的你很重要！！！

2021了，你知道在哪里获取优质的学习资源吗？

一个医保局长之死

给宠物做保姆的中国留学生

发SCI不用愁！想发核心论文的同学有救了，看完你就懂了。

全体出租车司机起诉交通局行政不作为案，明天开庭

清华学生国庆怒怼丘成桐！这事儿到底谁对谁错？

4ye含泪用python爬取了自己的公众号粉丝数据

4ye含泪用python爬取了自己的公众号粉丝数据

起因

坑🕳

正题

没有接口权限

结果数据

爬取思路

最后

您可能也对以下帖子感兴趣

一个医保局长之死

给宠物做保姆的中国留学生

发SCI不用愁！想发核心论文的同学有救了，看完你就懂了。

全体出租车司机起诉交通局行政不作为案，明天开庭

清华学生国庆怒怼丘成桐！ 这事儿到底谁对谁错？

生成图片，分享到微信朋友圈

4ye含泪用python爬取了自己的公众号粉丝数据

4ye含泪用python爬取了自己的公众号粉丝数据

起因

坑🕳

正题

没有接口权限

结果数据

爬取思路

最后

您可能也对以下帖子感兴趣

清华学生国庆怒怼丘成桐！这事儿到底谁对谁错？